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(57) Abstract 

Genes at least partially composed of stochastic synthetic polynucleotides are simultaneously produced wihtin the 
same medium, the genes thus obtained are introduced into host cells; the independent strains of modified host cells enclos- 
ing said genes are simultaneously grown, so as to clone the stochastic genes and to promote the production of the proteins 
expressed by each of said stochastic genes; the strains of modified host cells are screened and/or selected so as to identify 
the strains producing peptides or polypeptides showing at least a given property; the identified strains are isolated and 
grown so as to produce at least a peptide or polypeptide showing said property. Analogously, stochastic DNA orRNA se- 
quences showing at least a desired property can be produced by screening and selecting strains of modified host cells so as 
to identify the strains enclosing in their genome said DNA or RNA sequences. 

(57)Abrege 

On produit simultanement, au sein d'un meme milieu, des genes au moins partiellement composes de polynucle- 
otides synthetiques stochastiques; on introduit les g6nes ainsi obtenus dans des cellules-hotes; on cultive simultanement les 
souches independantes de cellules-bdtes modifiees renfermant ces genes, de maniere a doner les genes stochastiques et a 
provoquer la production des proteines exprimees par chacun de ces genes stochastiques; on effectue le criblage et/ou la se- 
lection des souches de cellules-hdtes modifiees de facon a identifier les souches produisant des peptides ou polypeptides 
ayant au moins une propriete donnee, on isole les souches ainsi identifiees et on les cultive de facon a produire au moins 
un peptide ou polypeptide ayant cette propriete. De facon similaire, on peut produire des sequences stochastiques d'ADN 
ou d'ARN presentant au moins une propriety d6siree en efTectuant le criblage ou la selection des souches de cellules-hotes 
modifiees de maniere a identifier les souches renfermant de telles sequences d'ADN ou d'ARN dans leur genome. 
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PROCEDE D ' OBTENTION D'ADN, ARN, PEPTIDES, 
POLYPEPTIDES OU PROTEINES . PAR UNE TECHNIQUE 
DE RECOMBINAISON D'ADN 

La prfisente invention a pour objet un procfidfi d'obtention 
d* ADN, ARN, peptides, polypeptides ou protfiines, au moyen 
de cellules-hfltes modifiers contenant des genes capables 
d'exprimer ces ARN, peptides, polypeptides ou proteines, 
c'est-a-dire en utilisant une technique de recombinaison 
d' ADN. 

L ' invention vise notamment a produire des genes ou frag- 
ments de genes stochastiques , de facon a permettre l'obten- 
tion simultane>, apres transcription et traduction de ces 
gSnes, d'un tres grand nombre (de l'ordre de dix mille au 
moins) de protSines completement nouvelles ou hybrides de 
prolines connues, en presence de cellules-hdtes (souches 
bactfiriennes ou eucaryotes) contenant les gSnes respective- 
ment capables d'exprimer ces proteines et d'effectuer 
ensuite une selection ou criblage parmi lesdites souches, 
en vue de determiner celles qui produisent des proteines 
prSsentant des proprietes disir^es, par exemple des pro- 
priStSs structurelles enzymatiques, cataly tiques , antigSni- 
ques, pharmacologiques, ou des proprietes de ligand, et 
plus gSnSralement, des proprietes chimiques, biochimiques , 
biologiques , etc . 

L ' invention a egalement pour but de permettre l'obtention 
de sequences d' ADN ou d'ARN prSsentant des proprietes 
utilisables, notamment des proprietes chimiques, biochimi- 
ques ou biologiques. 

On comprend done que 1' invention est susceptible de rece- 
voir de trSs nombreuses applicati ns, dans des domaines 
tres varifis de la science, d 1' Industrie et de la mede- 
cine. 
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Le procgdS de production d peptides ou polypeptid s selon 
1' invention est caracterisg en ce qu l'on produit simulta- 
neities, au sein d'un merae milieu, d s genes au moins 
partiellement composes de polynucleotides synthetiques 
stochastiques, que l'on introduit les genes ainsi obtenus 
dans des cellules-h6tes, que l'on cultive simultanement les 
souches indfipendantes de cellules-hfites modifiees renfer- 
mant ces genes, de maniSre a doner les genes stochastiques 
et a provoquer la production des protSines exprimfies par 
chacun de ces genes stochastiques, que l'on effectue le 
criblage et/ou la selection des souches de cellules-hdtes 
modifiers de facon a identifier les souches produisant des 
peptides 6u polypeptides ayant au moins une propriety 
donn§e, que l'on isole les souches ainsi identifies et 
qu'on les cultive de facon a produire au moins un peptide 
ou polypeptide ayant ladite propriete. 

ConformSment a un premier mode de mise en oeuvre de ce 
procSdS, on produit les genes par copolymer isation stochas- 
tique des quatre sortes de deoxyphosphonucleotides A, C, G 
et T a partir des deux extremitfis d'un vecteur d' expression 
prgalablement linearise, puis formation d'extremites 
cohesives de facon a former un premier brin d'ADN stochas- 
tique, constituS d'une molecule du vecteur d' expression 
possedant deux sequences stochastiques dont les extremites 
3' sont compiementaires, suivie de la synthase du second 
brin de cet ADN stochastique. 

Selon un deuxiSme mode de mise en oeuvre, on produit les 
genes par copolymerisation stochastique d" oligonucleotides 
sans extremites cohesives, de facon a former des fragments 
d'ADN stochastiques, suivie de la ligation de ces fragments 
a un vecteur d' expression prealablement linearise. 

Le vect ur d' expression peut etre un plasmide, notamment un 
plasmide bacterien. D'excell nts resultats ont 6te obtenus 
en utilisant, comme v cteur d' expression, 1 plasmid pUC8. 



WO 86/05803 



PCT/CH85/00099 



3 

Le vecteur d' expression peut egalement etre un ADN viral ou 
un hybride de plasraide et d'ADN viral. 

Les cellules-hStes peuvent etre des cellules procaryotes 
telles que les cellules HB 101 et C 600, ou des cellules 
eucaryotes . 

Lorsque l'on procede conformement au deuxieme mode de mise 
en oeuvre susmentionnfi , on peut utiliser des oligonucleo- 
tides fonnant un groupe d'octameres palindromiques . 

Des riSsultats particuliSrement bons sont obtenus en utili- 
sant le groupe d'octamSres palindromiques suivant : 

5' GGAATTCC 3' 
5' GGTCGACC 3' 
5' CAAGCTTG 3' 
5' CCATATGG 3 1 
5 ' CATCGATG 3 » . 

On peut egalement utiliser des oligonucleotides formant un 
groupe d'heptamSres palindromiques. 

De tres bons rSsultats sont obtenus en utilisant le groupe 
d'heptamSres palindromiques suivant : 

51 XTCGCGA 3' 
5' XCTGCAG 3' 
5' RGGTACC 3' 

OU X = A, G, C ou T et R » A ou T. 

Conformement a un mode de mise en oeuvre particuliSrement 
avantageux, l'on isole et purifie l'ADN transformant des 
plasmides provenant d'une culture de souches independantes 
de cellules-h6tes modifiers obtenues n procfidant d la 
maniSre specif iee ci-dessus f puis l'on provoque la coupure 
de l'ADN purifie" au moyen d'au moins un enzyme d 
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restriction porr spondant k un site spgcifiqu de coupure 
enzymatique prSsent dans ces octam&res ou heptam&r s 
palindromiques mais absent du vecteur d' expression utilisg, 
cette coupure 6tant suivie de 1 1 inactivation de 1' enzyme de 
restriction, et l'on traite ensuite simultan&nent l 1 ensem- 
ble des fragments d'ADN stochastiques lin6aris£s, ainsi 
obtenus, par la T4 DNA ligase, de fagon & crSer un nouvel 
ensemble d'ADN contenant des sequences stochastiques 
nouvelles, ce nouvel ensemble pouvant done contenir un 
nombre de gSnes stochastiques supgrieur au nombre de g&nes 
de 1* ensemble initial, et on utilise ce nouvel ensemble 
d'ADN transformant pour modifier des cellules-hdtes et 
doner les gSnes, et, finalement, on crible et/ou on 
sSlectionne et on isole les nouvelles souches de cellules- 
hdtes transformSes et finalement, on les cultive de fagon i 
produire au moins un peptide ou polypeptide, par exemple 
une protgine nouvelle. 

La proprifitS servant de crit&re de sS lection des souches de 
cellules-hdtes peut Stre 1' aptitude des peptides ou poly- 
peptides, produits par cette souche, h catalyser une 
reaction chimique donnge. 

Par exemple, pour la production d'une plurality de peptides 
et/ou polypeptides, ladite propriSt§ peut itre 1' aptitude & 
catalyser une sequence de reactions conduisant d'un groupe 
initial donnS de composes chimiques & au moins un compost 
cible. 

En vue de la production d'un ensemble constitug d'une 
plurality de peptides et/ou polypeptides rgf lexivement 
autocatalytiques, ladite propriSt§ peut Stre 1' aptitude de 
catalyser la synthase de cet ensemble lui-m&me h partir 
d'acides amines et/ou d 1 oligopeptides, dans un milieu 
appropr iS • 

Ladite proprifitg peut ggalement §tr 1' aptitude k modifier 
sSlectivement les propriSt§s chimiques et/ou biologiques 
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d'un compose donne, par exemple l'aptitud a modifier 
sglectivement 1' activity catalytique d'un polypeptide. 

Ladite proprigtg peut aussi etre Inaptitude a simuler, 
inhiber ou modifier au moins une fonction biologique d'au 
moins un compose biologiquement actif, choisi, par exemple, 
parmi les hormones, les neurotransmetteurs , les facteurs 
d* adhesion ou de croissance et les regulateurs specif iques 
de la replication de l'ADN et/ou de la transcription et/ou 
de la traduction de l'ARN. 

Ladite propri€t€ peut etre, ggalement, 1' aptitude du 
peptide ou polypeptide a se lier a un ligand donng. 

L ' invention a ggalement pour objet 1' utilisation du peptide 
ou polypeptide obtenu par le procgdg spgcifig ci-dessus 
pour la dgtection et/ou la titration d'un ligand. 

Conformement a un mode de mise en oeuvre particulierement 
avantageux, le critere de sSlection de la souche de cel- 
lules-hBtes modifige est 1' aptitude des peptides ou poly- 
peptides a simuler ou modifier les effets d'une molgcule 
biologiquement active, par exemple une protgine, et l'on 
effectue le criblage et/ou la sglection de la souche de 
cellules-hdtes modifige produisant au moins un peptide ou 
polypeptide ayant cette proprigtg en prgparant des anti- 
corps contre cette molgcule active, et en utilisant ces 
anticorps, apres leur purification, pour identifier les 
souches contenant ce peptide ou polypeptide, puis en 
cultivant les souches ainsi identifiges et en sgparant et 
en purifiant le peptide ou polypeptide produit par ces 
souches, et, finalement, en soumettant ce peptide ou 
polypeptide a un essai in vitro pour vgrifier qu'il prg- 
sente bien 1* aptitude a simuler ou modifier les effets de 
ladite molgcule. 

Conformgment a un autre mode de mise en oeuvre du procgdg 
selon 1' invention, la proprigtg servant de critere de 



WO 86/05803 



PCT/CH85/000W 



6 

selection est d' avoir au moins un Epitope semblable h l'un 
des epitopes d f un antigSne donne. 

L' invention porte egalement sur les polypeptides obtenus 
par le procgdS specif i€ ci-dessus, et utilisables comme 
substance active chimioth6rapeutique. 

En particulier r dans le cas oCL ledit antigSne est 1 1 EGF , 
1' invention permet l'obtention de polypeptides utilisables 
pour le traitement chimioth€rapeutique des epithSliomes. 

Selon une variante du procedg, l'on identifie et isole les 
souches de cellules-hates modifies produisant les peptides 
ou polypeptides ayaht la proprietg dSsirfie par chromato- 
graphie d'af finite sur anticorps correspondant & une 
protSine exprimge par la partie naturelle de l'ADN hybride. 

Par exemple, dans le cas oil la partie naturelle de l'ADN 
hybride contient un gSne exprimant la p-galactosidase, l'on 
peut avantageusement identifier et isoler lesdites souches 
de cellules-h6tes modifi§es par chromatographie d'af finite 
sur anticorps anti- j3-galactosidase. 

Apr&s expression et purification des peptides ou polypepti- 
des hybrides, on peut sgparer et isoler leurs parties 
nouvelles. 

L* invention porte egalement sur une application du proc§d§ 
specif ie ci-dessus pour la preparation d'un vaccin, cette 
application etant caracterise par le fait que l'on 
isole des anticorps contre un agent pathogfcne, par exemple 
des anticorps formes aprSs injection de cet agent pathog&ne 
dans I'organisme d'un animal capable de former des anti- 
corps contre cet agent, et on utilise ces anticorps pour 
identifier les clones produisant au moins une proteine 
ayant au moins un epitope semblable k l'un des epitopes de 
1' agent pathog&ne, on cultive 1 s souches de cellules-h6tes 
modifiees correspondant cl ces clones, de facon h produire 
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cette protSine, on isole et purifie cette proline a partir 
des cultures de ces souches de cellules, et on utilise 
cette proteine pour la production d'un vaccin centre 
V agent pathogSne. 

Par exemple, pour la preparation d'un vaccin anti-HVB, l'on 
peut extraire et purifier au moins une proteine de capside 
de virus HVB, injecter cette proteine dans l'organisme d'un 
animal capable de former des anticorps centre cette pro- 
line, recueillir et purifier les anticorps ainsi formes, 
utiliser ces anticorps pour identifier les clones produi- 
sant au moins une proteine ayant au moins un epitope 
semblable a l'un des epitopes du virus HVB, cultiver les 
souches de cellules-h6tes modifiers correspondant a ces 
clones, de fagon a produire cette proteine, isoler et 
purifier cette proteine a partir des cultures de ces- 
souches de cellules, et utiliser cette proline pour la 
production d'un vaccin anti-HVB. 

Avantageusement, conforraement a un mods de mise en oeuvre 
du process selon 1' invention, les cellules-notes consistent 
en bactgries du genre Escherichia coli dont le genome ne 
contient ni le gene naturel exprimant la p-galactosidase, 
ni le gene EBG, e'est-a-dire des bacteries E. coli (Z , 
EBG"), on cultive les cellules-h6tes modifi§es en presence 
du milieu X-gal .et de 1' indue teur IPTG, que l'on detecte, 
dans le milieu de culture, les clones positifs pour la 
fonction p-galactosidase, et, finalement, on transplante 
ensuite cet ADN dans une souche de cellules-h&tes appro- 
priee a la culture en grande quantite en vue de la produc- 
tion industrielle d'au moins un peptide ou polypeptide. 

La propriete servant de critere de selection des souches de 
cellules-hotes transformees peut 6galement §tre 1' aptitude, 
des polypeptides ou proteines, produites par culture de ces 
souches, a se lier a un compose donne. 
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Ce compose peut Stre, notamment, avantageusement choisi 
parmi les peptid s, les polypeptides t les protein s, 
notamment les protfiines rfigulatrices de I'activite de 
transcription de l'ADN. 

D • autre part, ledit compose peut Sgalement fetre choisi 
parmi les sequences d'ADN et d'ARN. 

L' invention a ggalement pour objet les prot§ines obtenues 
dans le cas oil la propri€te servant de critSre de selection 
des souches de cellules-h6te transform§es consiste pr§cisS- 
ment dans 1' aptitude de ces proteines h se lier & des 
proteines r6gulatrices de l 1 activity de transcription de 
l'ADN, ou encore k des sequences d'ADN ou d'ARN. 

L' invention a, en outre, pour objet 1' utilisation d'une 
protSine, obtenue dans le premier cas particulier qui vient 
d'etre mentionnS, comme sequence cis-regulatrice de la 
replication ou la transcription d'une sequence d'ADN 
voisine. 

D' autre part, 1' invention a ggalement pour objet 1 'utilisa- 
tion des proteines obtenues. dans le second cas particulier 
susmentionne pour modifier les proprietes de transcription 
ou de replication d'une sequence d'ADN, dans une cellule 
contenant cette sequence d'ADN, et exprimant cette pro- 
tSine, 

L' invention a egalement pour* objet un procSdS de production 
d'ADN, caractirisS par le fait que I'on produit simultane- 
ment, au sein d f un m§me milieu, , des gSnes au moins partiel- 
lenient composes de polynucleotides synthetiques stochasti- 
ques, que I'on introduit les gSnes ainsi obtenus dans des 
cellules-hdtes, de fagon b. produire un ensemble de cel- 
lules-h8tes modifiSes, que I'on effectue un criblage et/ou 
une selection de cet ensemble , de fagon h identifier les 
cellules h6tes qui renferment dans leur genome des sequen- 
ces stochastiques d'ADN pr6sentant au moins une propri€te 
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dgsirg , et l'on isole finalement I'ADN k partir de cul- 
tures des cellules-hdtes ainsi id ntifiges. 

L 1 invention a f en outre, pour objet un procgdg'de produc- 
tion d , ARN, caractgrisg par le fait que l'on produit 
simultangment, au sein d'un m&rae milieu , des gSnes au moins 
partiellement composgs de polynucleotides synthgtiques 
stochastiques, que l'on introduit les g&nes ainsi obtenus 
dans des cellules-h6tes, de facon k produire un ensemble de 
cellules-hates modifies, que l f on cultive simultangment 
les souches indSpendantes de cellules-hdtes niodifiSes ainsi 
produites, que l'on effectue un criblage et/ou une selec- 
tion de cet ensemble, de fagon k identifier les cellules- 
h6tes qui renferment des sSquences stochastiques d'ARN 
prSsentant au moins une propriStS dgsirge, et que l'on 
isole I'ARN & partir de cultures de cellules-hdtes ainsi 
identif iges. 

Ladite propriS tg peut gtre, avantageusement # 1' aptitude k 
se lier k un composg donng, qui peut etre, par exemple, un 
peptide, un polypeptide ou une protfiine, ou bien 1' aptitude 
k catalyser une reaction chimique donnge, ou encore la 
propri€t§ d'etre un ARN de transfert. 

On va maintenant dgcrire, plus en details, le procgdg selon 
1' invention, ainsi que certaines de ses applications, en se 
rSf Srant St des exemples, non limitatifs, de mise en oeuvre. 

Tout d'abord, on va dgcrire des modes opgratoires particu- 
liSrement avantageux pour effectuer la synthase de gSnes 
stochastiques et 1 1 introduction de ces gSnes dans des 
bacteries, de maniSre k produire des souches de bactgries 
transformges. 

I) Synthase direct sur un vecteur d 1 expression 



a) Linearisation du vecteur 
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x 3 

30 ug (c'est-a-dire approximativement 10 molecules) du 
vecteur d' expression pUC8 sont linearises par incubation 
pendant 2 heures a 37Mavec 100 unit€s de 1» enzyme de 
restriction PstI dans une volume de 300 ul du tampon 
standard approprie. Le vecteur linearise 1 est traite au 
phenol-chloroforrae puis pr€cipite a l'gthanol, repris dans 
un volume de 30 ;il et charge sur un gel d' agarose a 0,8 %, 
en milieu standard TEB. Apr&s migration dans un champ de 
3V/cm pendant trois heures, le vecteur lineaire est eiectro- 
eiue, prgcipit§ a l'ethanol et repris dans 30 ^il d'eau. 



b) Synthese stochastique par 1' enzyme 
Terminal-Transfgrase (TdT) 

On fait rgagir 30 ;ig du vecteur linearise avec 30 unites de 
TdT dans 300 ;il du tampon approprie, pendant deux heures, a 
37 °C, en presence de ImM de dGTP, ImM de dCTP, 0,3mM de 
dTTP et ImM de dATP: On choisit une concentration plus 
basse de dTTP, dans le but de diminuer la frequence des 
codons "stop" dans l'ARN messager correspondant. Un risul- 
tat semblable, quoique moins favorable, peut Stre obtenu en 
utilisant une concentration plus basse pour le d' ATP que 
pour les autres deoxynucieotides triphosphates. Le progrSs 
de la reaction" de polymerisation sur 1 ' extremite 3' des 
sites Pst I est suivi par 1' analyse sur gel de parties 
aliquotes prSlev€es en cours de reaction. 

Lorsque la reaction atteint ou dSpasse une valeur moyenne 
de 300 nucleotides par extremite 3', elle est interrompue 
et les nucleotides libres sont sgpargs du polymere par 
precipitation diffSrentielle ou par passage sur tamis 
moliculaire du type Biogel P60. AprSs concentration par 
precipitation a l'ethanol, le polymere est soumis sgquen- 
tiellement a une polymerisation suppiementaire par TdT en 
presence de dATP d'abord, puis de dTTP. Ces deux dernieres 
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reactions sont sgparges par une filtration sur gel et 
conduites pendant des temps courts (30 secondes a 3 minu- 
tes) , de maniere a aboutir a 1' addition sequentielle de 
10-30A, suivis de 10-30 T a l'extremite 3' des polymeres. 

c) Synthase du second brin de l'ADN stochastique 

Chaque molecule de vecteur possede, a 1' issue des opera- 
tions prec€dentes, deux sequences stochastiques dont les 
extr§mit6s 3' sont compiementaires. Le melange de polymeres 
est alors incube dans des conditions favorisant 1' hybrida- 
tion de ces extremitfis compiementaires (150 mM Naci,. 10 mM 
Tris-HCl, pH 7,6, 1 mM EDTA, a 65 °C, pendant 10 minutes, 
puis abaissement de la temperature jusqu'a 22°C, a raison 
de 3 a 4°C/heure) . Les polymeres hybridSs sont alors sounds 
a 1* action de 60u du grand fragment de la polymerase I 
(Klenow) en presence des quatre nucleotides triphosphates 
(200mM) a 4°C, pendant deux heures. Cette etape realise la 
synthese du second brin a partir de l'extremite 3' des 
polymeres. hybrides. Les molecules resultant de cette 
synthase directe a partir d'un vecteur linearise sont alors 
utilisSes pour transformer des cellules competentes. 

d) Transformation des souches competentes 

100 a 200 ml de cellules competentes HB101 ou C600, a la 

concentration de 10 10 cellules/ml, sont incubes avec la 

preparation d'ADN stochastique, en presence de 6mM CaCl 2 , 6 

mM Tris-Hcl, pH8, 6 mM MgCl 2 , pendant 30 minutes, a 0°C. Un 

choc thermique de 3 minutes a 37°C est impose au melange, 

suivi par 1» addition de 400-800 ml de milieu de culture 

NZY, sans antibiotique. La culture transformee est incubee 

a 37°C pendant 60 minutes, puis diluee a 10 litres par 

addition de milieu NZY contenant 40 yug/ml d'ampicilline. 

Apres 3 a 5 heures d 1 incubation a 37 °C, la culture ampli- 

fiee est soumise a une cent rifugat ion, t le culot des 

cellules transformees est lyophilyse et conserve a -70°C. 

7 8 

Une telle culture comprend de 3 x 10 a 10 transformants 
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independants, contenant chacun un gene stochastique unique 
ins€r€ dans un vecteur d' expression. 

ID synthese de genes stochastigues a p artir d* oligo- 
nucleotides sans extr6mit6s cohfisives 

Ce mode operatoire est fondS sur le fait que la polymerisa- 
tion d' oligonucleotides palindromiques judicieusement 
choisis permet d' assembler des genes stochastiques ne 
comportant aucun codon "stop" dans chacun des six cadres de 
lecture possibles, tout en assurant une representation 
gquilibree de triplets specif iant tous les acides amines. 
Par ailleurs, et pour eviter la repetition de motifs de 
sequences dans la proteine resultante, les oligonucleotides 
penvent comporter un nombre de bases qui n'est pas un 
multiple de trois. L'exemple suivant decrit 1 • utilisation 
d'une combinaison possible d' oligonucleotides qui remplit 
ces critSres : 

a) Choix d'un groupe d'octamSres 



Le groupe d * oligonucleotides suivant : 

5' GGAATTCC 3' 
5' GGTCGACC 3' 
5' CAAGCTTG 3' 
5' CCATATGG 3' * 
5' CATCGATG 3' 

est compose de 5 palindromes (done autocompiementaires) 
dont il est facile de verifier que leur polymerisation 
stochastique n'engendre pas de codon "stop" et specif ie 
tous les acides amines. 

Bien entendu, on pourrait egalement utiliser d'autres 
groupes d'octamSres palindromiques n'engendrant pas de 
codons "stop" et specif iant tous les acides amines des 
polypeptides. On comprendra egalement que l'on pourrait 
utiliser des groupes d'octamSres non palindromiques a 
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condition d' employer aussi leurs complements par la forma- 
tion de segments bicatenaires. 

b) Assemblage d'un gSne stochastique h partir d'un groupe 



d'octamSres 



On fait rSagir un melange comportant 5 fig de chacun_ des 
oligonucleotides indiquSs ci-dessus (prSalablement phospho- 
rylSs en 5 f par un proc6dS connu en soi) dans un volume de 
100 jil contenant 1 mM ATP, 10 % de polyfithylSneglycol et 
100 u de T 4 DNA ligase, dans le tampon approprie, h 13 °C, 
pendant six heures. Cette 6tape effectue la polymerisation 
stochastique des oligomSres sous forme bi-catenaire , sans 
extrSmitfis cohesives. On isole alors par passe sur tamis 
moieculaire (Biogel P60) les polymSres resultant de 1' as- 
semblage de 20 & 100 oligomSres. AprSs concentration, cette 
fraction est & nouveau soumise h la polymerisation cataly- 
s£e par la T4 DNA ligase dans les conditions decrites 
ci-dessus. On isole alors, comme decrit plus haut, les 
polymeres resultant de 1' assemblage d'au moins 100 oligo- 
mSres. 

c) Preparation du plasmide-hote 



Le vecteur d 1 expression pDC8 est linearise par l f enzyme Sma 
I dans le tampon approprie, comme decrit ci-dessus. Le 
vecteur linearise par 1* enzyme Sma I ne comporte pas 
d f extremit6s cohesives, Le vecteur linearise est alors 
traite par la phosphatase alcaline d'intestin de veau (CIP) 
h raison d'une unite par ;ig de vecteur dans le tampon 
approprie, h 37°C, pendant 30 minutes. L'enzyme CIP est 
alors inactivee par deux extractions successives au phenol- 
chloroforme. Le vecteur linearise et dephosphoryie est 
precipite & l'ethanol puis repris dans l f eau & 1 mg/ml. 

d) Ligation des gSnes stochastiques au vecteur 
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Des quantitSs gquimolaires de vecteur t de polym&re sont 
mglangees et incubees en presence de 1000 u de T4 DNA 
ligase, 1 mM ATP, 10 % de polyethylene glycol dans le 
tampon approprig, pendant 12 heures, a 13°C. Cette gtape 
realise la ligation des polymSres dans le vecteur d' expres- 
sion et engendre des molecules bicatenaires, circulaires 
et, par consequent, transformantes. 

Transformation des souches compStentes 

On procSde a la transformation des souches compgtentes de 
la mani§re prgcSdemment dScrite. 

Ill) Assemblage d'un gene stochastigue a partir d' un groupe 
d'heptameres 

Ce mode operatoire se distingue de celui qui vient d'etre 
dScrit par le fait qu'il utilise des heptamSres palindromi- 
ques comportant une extrgmitS cohgsive variable, au lieu 
d'octameres. II prgsente l'avantage de permettre 1' assem- 
blage de siquences stochastiques comportant une plus faible 
proportion de motifs identiques. 

a) Choix d'un groupe d'heptameres 

On peut utiliser, par exemple, les 3 heptamSres palindromi- 
gues suivants : 

5* XTCGCGA 3' 
5' XCTGCAG 3' 
5' RGGTACC 3 1 

pour lesquels X = A, G, C ou T et R = A ou T et dont la 
polymerisation ne peut engendrer de codons "stop" et 
comporte des triplets spScif iant tous les acides amines. 



Bien entendu, on pourrait ggalement utiliser tout autre 
groupe d'heptam&res remplissant ces m§mes conditions. 
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b) Polymerisation d'un groupe d'heptameres 

Cette polymerisation s'effectue exactement de la maniere 
pr6c§demraent d6crite dans le cas des octameres. 

c) Elimination des extremity s cohSsives 

Les polymeres ainsi obtenus comportent une base non appa- 
rifie k leur deux extremites 5". II est done necessaire 
d'additionner la base complementaire aux extr6mit€s 3' 
correspondantes. Ceci s'effectue de la maniere suivante : 
on fait reagir 10 ;ig de polymeres double brin avec 10 u 
d' enzymes de Klenow, en presence des quatre dSoxynucleo- 
tidephosphates (200 mM) dans un volume de 100 ;il, a 4°C, 
pendant 60 minutes. L ' enzyme est inactiv€e par extraction 
au phenol-chloroforme et les polymeres sont dSbarrassSs des 
nucleotides libres residuels par precipitation differen- 
tielle. Les polymeres sont alors ligases au plasroide-hote 
(prSalablement linearise et dephosphoryie) en procedant de 
la maniere decrite ci-dessus. 

II est a remarquer que les deux dernier s modes operatoires 
qui viennent d'etre decrits utilisent des octamSres ou 
heptameres palindromiques qui constituent des sites speci- 
fiques d' enzymes de restriction. Ces sites sont absents 
pour la plupart du vecteur d' expression pOC8. II est done 
possible d'augmenter considSrablement la coraplexite d'une 
preparation initiale de genes stochastiques en procedant de 
la maniere suivante : on prepare l'ADN des plasmides 
provenant d'une culture de 10 7 transformants independants 
obtenus par l'un des deux demiers modes operatoires 
dScrits ci-dessus. A cet ADN purifie, on fait alors subir 
une digestion partielle par 1' enzyme de restriction Cla I 
(mod op6ratoire II) ou par 1' hzyme de restriction Pst I 
(mode operatoire III). AprSs inactivation de 1' enzyme, 
l'ADN partiellement dig€r€ est traite a la T4 DNA ligase, 
ce qui a pour effet de cr€er un nombre extremem nt grand de 
sequences nouvelles qui conservent les proprietes 
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fondamentales des sequences initiales. Ce nouv 1 ensemble 
de sequences stochastiques est alors .utilise pour transfor- 
mer des cellules compStentes. 

Par ailleurs, les genes stochastiques clones en procSdant 
conformSment aux modes opSratoires II et III peuvent etre 
excises intacts du vecteur d' expression pUC8 en utilisant 
les sites de restriction propres au vecteur de clonage et 
non represents dans l'ADN stochastique. 

La recombinaison au sein des gSnes stochastiques engendres 
par les deux derniers modes operatoires qui vienhent d'etre 
decrits, recombinaison qui rfisulte de l'homologie interne 
et des motifs de recurrence, fournit une importante methode 
additionnelle de mutagenese in vivo des sequences codantes. 
II en resulte une augmentation du nombre des genes nouveaux 
qui peuvent etre examines. 

Finalement, pour tout processus de generation de genes 
synthetigues nouyeaux, on peut utiliser de nombreuses 
techniques usuelles de modification des genes in vivo ou 
in vitro , telles que changement du cadre de lecture, 
inversion des sequences par rapport a leur promoteur, ou 
utilisation de souches-h&tes exprimant un ou plusieurs tRNA 
suppresseurs. 

En se referant a la partie de la description qui precede, 
on comprendra qu'il est possible de construire in vitro un 
nombre extremement grand (par exemple, superieur a un 
milliard) de genes differents, par polymerisation enzyma- 
tique de nucleotides et d* oligonucleotides. Cette polymeri- 
sation s'effectue selon un processus stochastique determine 
par les concentrations respectives des nucleotides ou 
oligonucleotides presents dans le milieu de reaction. 

Comme indique ci-dessus, deux methodes peuvent etre utili- 
sees pour doner de tels gSnes (ou sequences codant s) : la 
polymerisation peut s'effectuer directement sur un vecteur 
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de clonage d' expression, prealablement linearis^, ou bien 
on peut choisir de proceder sequentiellement a la polymeri- 
sation puis a la ligation des polymSres au vecteur de 
clonage et d' expression. 

Dans les deux cas, on precede ensuite a la transformation 
ou a la transfection de cellules bacteriennes competentes 
(ou de cellules en culture) . Cette etape realise le clonage 
des genes stochastiques dans des cellules vivantes ou ils 
sont indfifiniment propages et exprimes. 

Bien entendu, outre les modes operatoires qui viennent 
d'etre decrits, on pourrait egalement employer toute autre 
methode appropriee pour la synthese de sequences stochas- 
tiques. En particulier, on pourrait proceder a la polymeri- 
sation, par voie biochimique, d'oligomeres monocatenaires 
d'ADN ou d'ARN obtenus par synthese chimique, puis traiter 
ces segments d'ADN ou d'ARN par des process connus en soi 
de preparation de copies d'ADN (c ADN) bicatenaire en vue 
du clonage des genes. 

Criblage ou selection des sou ches de cellules-h6tes 
modif i§es 

L' etape ulterieure du procede selon 1' invention consiste a 
examiner les cellules transformies ou transferees, par 
selection ou criblage, en vue d'isoler une ou plusieurs 
cellules dont l'ADN transformant ou transfectant conduise 
la synthese d'un produit de transcription (ARN) ou de 
traduction (protline) possSdant une propriSt€ souhaitee. 
Ces propri€t€s peuvent etre, par exemple, enzymatiques , 
fonctionnelles ou structurelles. 

Une des particularity les plus remarquables du procedS 
selon 1- invention est de permettre le criblage ou la 
selection simultanee d'un produit exploitable (ARN ou 
proteine) et de son gene producteur. De surcrolt, l'ADN 
synthetise" et clonfi comme decrit peut etre s61ectionn§ ou 



WO 86/05803 



PCT/CH85/00099 



18 

criblS en vue d'isoler d s sequences d'ADN constituant un 
produit n soi, dot6 de propri6t6s biochimiqu s exploita- 
bles. 

On va maintenant d€crire, & titre d'exemples non limita- 
tifs, des modes op§ratoires pr6f§rentiels pour le criblage 
ou la selection de s ouches de cellules transformSes ainsi 
que des prot€ines nouvelles pr§sentant un intfirSt en vue 
d 1 applications industrielles ou m€dicales. 

L'un de ces modes opSratoires r 6 suite de l'id£e de produire 
une sSrie d'anticorps polyclonaux ou monoclonaux, obtenus 
de maniere connue en soi, dirigSe contre une protSine ou un 
autre type de mol§cule d'intiret biochimique ou mSdical, 
cette molecule etant, ou pouvant §tre rendue, immunogSni- 
que, et d'utiliser ces anticorps comme sonde pour identi- 
fier parmi de trSs nombreux clones transformSs par des 
genes stochastiques ceux qui rSagissent avec ces anticorps. 
Cette reaction rSsulte de l'homologie de structure existant 
entre le polypeptide synthStisS par le g§ne stochastique et 
la molecule initiale. On peut ainsi isoler de nombreuses 
protSines nouvelles se comportant comme des Epitopes ou 
determinants antigeniques de la molecule initiale. De 
telles proteines nouvelles sont susceptibles de simuler, 
stimuler, moduler ou bloquer I'effet de la mol§cule ini- 
tiale. On comprendra que ce mode de selection ou de cri- 
blage est, en lui-meme, susceptible d' avoir de tr5s nom- 
breuses applications pharmacologiques et bio-m€dicales. On 
va maintenant dScrire, & titre d'exemple non limitatif, ce 
premier mode op€ratoire en relation avec un cas particulier 
. 

L'EGF (epidermal growth factor) est une petite prot§ine 
presente dans le sang et dont le rdle est de stimuler la 
croissance des cellules fipithfiliales. Cet effet est obtenu 
par 1 ' interaction de I'EGF avec un rScepteur spScifique 
si tu§ dans la membrane des cellules 6pith€liales. 
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On prSpar d s anticorps dirigSs contre l'EGF par injection 
chez 1' animal d'EGF couplS a KLH (keyhol limpet hemocya- 
nin) pour augmenter 1' immunogSnicitS de l'EGF. Les anti- 
corps anti-EGF des animaux iromunisSs sont purifiSs, par 
exemple par passage sur une colonne d'affinitS, dont le 
ligand est l'EGF ou un peptide de synthese correspondant a 
un fragment d'EGF. Les anticorps anti-EGF purifies sont 
utilises comme sonde pour le criblage d'un grand nombre de 
clones bactSriens lysSs au chloroforme sur support solide. 
Les anticorps anti-EGF se combinent aux peptides ou pro- 
tSines stochastiques dont les Epitopes ressemblent a ceux 
de l'antigene initial. Les clones contenant ces peptides ou 
prolines sont mis en evidence par autoradiographic apres 
incubation des supports solides avec de la protSine A 
radioactive ou apres incubation avec un anticorps anti- 
anticorps radioactif. 

Ces Stapes identifient les clones contenant chacun une 
protSine (et son gene) rSagissant avec 1' anticorps de 
criblage. On peut ainsi faire des criblages parmi un tres 
grand nombre de souches cellulaires bactSriennes ou de 
plaques virales (par exemple de l'ordre de un million) et 
il est possible de dStecter des quantitSs extremement 
faibles, par exemple de l'ordre de 1 ng, de protSine 
produite. On procede alors a la culture des clones identi- 
fies puis a la purification des protSines dStectSes par les 
moyens conventionnels . Les protSines purifiSes sont testSes 
in vitro dans des cultures de cellules SpithSliales pour 
dSterminer si elles inhibent, simulent ou modulent l'effet 
sur ces cultures de l'EGF. Certaines des protSines obtenues 
par ce moyen sont susceptibles d'etre utilisSes pour le 
traitement chimiothSrapique des SpithSliomes. Les activitSs 
des protSines ainsi obtenues peuvent etre amSliorSes par 
mutation de l'ADN codant pour les protSines, de maniire 
analogue a celle dScrite ci-dessus. Une variante de ce mode 
opSratoir consiste a purifier des peptides, polypeptides 
ou protSines stochastiques, pouvant etre utilisSes comme 
vaccins ou plus gSnSralement pouvant etre utilisSes pour 
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confSrer une immunity contre un agent pathogSn ou pour 
exercer d'autres effets sur le systeme immunologique, par 
exemple, cr6er une tolerance ou diminuer l'hypersensibilit§ 
k I'ggard d'un antigSne donnS, notamment par suite de la 
combinaison de ces peptides, polypeptides ou prolines avec 
les anticorps dirig€s cohtre cet antigSne. On comprendra 
que l'on peut utiliser ainsi ces peptides, polypeptides ou 
prolines aussi bien in vitro qu' in vivo . 

Plus prgcisSment, par exemple, dans 1' ensemble des pro- 
twines nouvelles qui rSagissent avec l 1 anticorps contre un 
antig&ne donn6 X, chacune a au moins un Spitope en commun 
avec X r done l 1 ensemble a un ensemble d* epitopes commun 
avec X* Ceci permet d' utiliser 1* ensemble ou un sous-ensem- 
ble comme vaccin pour conf§rer 1' immunity contre X. II est, 
par exemple, ais§ de purifier une ou plusieurs des proli- 
nes de capside du virus de l'h€patite B. Ces prot€ines sont 
injectges chez l 1 animal, par exemple le lapin, et on 
recueille les anticorps correspondant k l 1 antigSne de 
depart par purification sur colonne d'affinitS. On utilise 
ces anticorps, de la maniSre dScrite ci-dessus, pour 
identifier les clones produisant une protSine ayant un 
Epitope semblable & l'un au moins des Epitopes de 1' anti- 
gSne initial. AprSs purification, on utilise ces protSines 
comme antigSne (soit isol§ment, soit en combinaison) dans 
le but de confSrer une protection contre 1' hepatite B. La 
production ultfirieure du vaccin ne nScessite plus le 
recours & I 1 agent pathogSne initial, 

II est k remarquer que, lors de la description des modes 
opgratoires qui pr§cSdent, un certain nombres de maniSres 
de procSder k la selection et au criblage ont §t§ dScrits. 
Tous ces modes opfiratoires impliquent la purification d'une 
protSine particuliSre k partir d'une souche transform§e. 
Ces purifications de protgines peuvent Stre ffectu§es 
conformSment aux m€thodes usuelles et font appel, en 
particulier, aux techniques de chromatographie sur gel, sur 
gchangeur d'ion, et k la chromatographie d 1 affinity. Par 
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ailleurs, les protgines issues de gSnes stochastiques 
p uvent avoir €t6 clonges sous forme de prolines hybrides, 
comportant, par exemple, une sequence de 1" enzyme 
f-galactosidase permettant la chromatographic d'affinitgs 
sur anticorps anti-/2-galactosidase et permettant le clivage 
subsequent de la partie hybride (c'est-i-dire permettant de 
sgparer la partie nouvelle de la partie bactfirienne) .On va 
maintenant dScrire le principe et la mise en oeuvre de la 
selection des peptides ou polypeptides et des gSnes corres- 
pondants, exprimant ces peptides ou polypeptides, conformS- 
ment k une deuxi&me mgthode de criblage ou selection fondfie 
sur la detection de l 1 aptitude de ces peptides ou polypep- 
tides k catalyser une reaction spScifique, 

A titre d 1 exemple concret non limitatif, on va dgcrire 
la mise en oeuvre du criblage ou de la selection dans le 
cas particulier de protgines capables de catalyser le 
clivage du lactose, ce qui est normalement une fonction 
remplie par 1' enzyme (3-galactosidase ((3-gal) . 

Comme dgcrit ci-dessus, la premiere gtape du procgdg 
consiste k engendrer un trSs grand ensemble de vecteurs 
d 1 expression exprimant chacun une protgine nouvelle dis- 
tincte. De mani&re concr&te, on peut, par exemple, choisir 
le vecteur d f expression pUC8 avec clonage de sgquences 
stochastiques d'ADN au site de restriction Pst I. 
Les plasmides ainsi obtenus sont ensuite introduits dans 
une souche de E. coli dans le ggnome de laquelle on a 
gliming par les mgthodes ggngtiques conventionnelles le 
gSne naturel pour la (3-galactosidase, Z, et un deuxiSme 
g5ne EBG, sans rapport avec le le premier, mais capable de 
muter vers la fonction (3-gal. De telles cellules-h6tes (Z , 
EBG") ne sont pas capables par elles-mSmes de catalyser 
l'hydrolyse du lactose et, par consgquent, d'utiliser le 
lactose comme source de carbone pour la croissance. Ceci 
permet d'utiliser cette souche h&te pour le criblage ou la 
sglection de la fonction {J-gal. 
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One mgthode d'essai biologique qui convient pour l'gtude 
des souches transformSes de E. coli prgsentant des genes 
nouveaux exprimant la f onction /3 -gal consiste dans la 
culture des bactfiries ainsi transfonnees dans des boites de 
pgtri renfennant le milieu X-gal. Dans ce cas, toute 
colonie bacterienne exprimant une f onction £ -gal est 
visualisee sous forme d'une colonie bleue. En utilisant un 
tel essai biologique, on peut dgtecter meme une activitg 
catalytique faible. L' activitg spgcifique des enzymes les 
plus caractiristiques s'gtablit entre 10 et 10 000 molgcu- 
les de produit par seconde. 

En supposant qu'une protgine synthgtisge par un gene 
stochastique prgsente une activitg spgcifique faible, de 
l'ordre de une molgcule par 100 secondes, il serait tou- 
jours possible de dgtecter une telle activitg catalytique. 
Dans une boite de Pgtri renfermant le milieu X-gal, en 
prgsence de l'inducteur non mgtabolisable IPTG (isopropyl- 
-D-thiogalactoside) la visualisation d'une rggion bleue 
requiert le clivage d' environ 10 10 a 10 molgcules de 
X-gal par millimetre carrg. Une colonie bactgrienne expri- 
mant un enzyme faible et occupant une superficie de 1mm 
contient environ 10 7 a 10 8 cellules. Si chaque cellule 
prgsente une seule copie de 1' enzyme faible, chaque cellule 
doit catalyser entre 10 000 et 100 clivages de X-gal afin 
de pouvoir etre dgtectge, ce qui prend environ 2,7 a 270 
heures. Etant donng que, dans des conditions sglectives, on 
peut s'attendre a une amplification du nombre des copies de 
plasmides par cellules, par exemple de 5 a 20 copies par 
cellule et meme de 100 k 1000, et compte tenu du fait que 
jusqu'a 10% des protgines de la cellule peuvent Stre 
spgcifiges par le nouveau gene, la durge ngcessaire a la 
dgtection d'une colonie bleue dans le cas de 100 molgcules 
d' enzymes de faible activitg spgcifique par cellule serait 
de l'ordre de 0,27 heure a 2,7 heures. 



Par consequent, le criblage d'un grand nombre de colonies 
bactgriennes indgpendantes, exprimant chacun un gene 
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nouveau different, en prenant comme critSre de selection la 
facultg d'exprimer la fonction £ -gal est parfaitement 
realisable. On peut ainsi rgaliser le criblage d r environ 
2000 colonies dans une boite de Pgtri ordinaire ayant 10 cm 
de diam&tre. Par consequent, on peut cribler environ ^20 
millions de colonies sur une feuille d'agar X-gal de 1 m . 

II est k remarquer que les colonies bactfiriennes apparais- 
sant en bleu sur les boites de Pgtri X-gal pourraient Stre 
faussement positives en raison d'une mutation dans le 
g&nome bactgrien lui confgrant la capacitg de mgtaboliser 
le lactose f ou pour d 1 autre raisons que celles qui rgsul- 
tent de 1' activity catalytique de la protSine nouvelle 
exprimge par les cellules de la colonie. De tels faux 
positifs peuvent Stre directement glimings en purifiant 
I'ADN des vecteurs d' expression provenant des colonies 
positives et en retransformant les cellules-h6tes E. Coli 
Z~,EBG~. Si I'activitg (i-gal rgsulte de la nouvelle pro- 
t§in,e codge par le nouveau gSne dans le vecteur d' expres- 
sion , toutes les cellules transformges par ce vecteur 
devraient presenter la fonction ^ -gal. Au contraire, si la 
colonie bleue initiale rgsulte d'une mutation dans le 
ggnome de la cellule hSte, il s'agit d'un gvgnement excep- 
tionnel indgpendant de la transformation et le nombre des 
cellules de la nouvelle souche transformge E. Coli servant 
d'hdte susceptible d'exprimer la fonction ^> -gal devrait 
gtre petit ou nul. 

On insistera particuli&rement sur la puissance de la 
purification en masse simultange des vecteurs d f expression 
pour tous les clones positifs (bleus) suivie par la retrans- 
formation des bactgries nalves. Supposons que I'on dgsire 
effectuer un criblage en vue de sglectionner des protgines 
ayant une fonction catalytique et que la probabilitg qu'un 
nouveau peptide ou polypeptide remplisse cett fonction , au 
moins faiblement, soit de 10~ 6 , alors que la probabilitg 
que la souche microbienne h5te E. Coli est suj tte & une 
mutation ayant pour effet quelle devienne capable de 
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remplir cette fonction, soit d 10" 5 , on peut calculer que 
sur 20 millions de bacteries transformers soumises au 
criblage, 20 clones positifs seront, en moyenne, attribua- 
bles aux genes nouveaux sur les vecteurs d' expression que 
chacune comporte, alors que 200 clones positifs rfisulteront 
de mutations d'arriere-plan. La purification en masse des 
vecteurs d'expression de l'intggralitS des 220 clones 
bacteriens positifs et la retrans formation des bact€ries 
nalves avec les vecteurs d'expression mis en commun pro- 
duira un grand nombre de clones positifs constitugs de 
toutes les bacteries transformers avec les 20 vecteurs 
d'expression qui codent les nouvelles prot€ines ayant la 
fonction disiree, et un trSs petit nombre de clones bact§- 
riens resultant de mutations d'arriSre-plan contenant les 
200 vecteurs d'expression restant sans intSrSt. Un petit 
nombre de cycles de purification de vecteurs d'expression 
dans les colonies bacte"riennes positives, ainsi que de 
re trans format ion, permet la detection des tres rares 
vecteurs d'expression vSritablement positifs par rapport a 
une activity catalytique d€siree, malgre - un bruit de fond 
tres 61evS de mutations des cellules-h&tes pour cette 
fonction. 

A la suite d f operations de criblage de ce genre, on peut 
purifier la nouvelle prot§ine grace a la mise en oeuvre de 
techniques .usuelles. La production de cette protSine en 
grande quantitS est rendue possible grace au fait que 
1 ' identification de la proteine utile s'accompagne de 
1 ' identification simultanSe du gSne codant " cette protSine . 
Par consequent, on peut utiliser le vecteur d'expression 
lui-meme ou bien on peut transplanter le gene nouveau dans 
un vecteur d'expression plus appropri§ a la synthese et a 
1' isolation en grande quantit§. 

On peut appliquer des modes de criblage de ce genre a toute 
fonction enzymatique pour laquelle il existe un essai 
biologique approprie". De tels criblages ne nicessitent pas 
que la fonction enzymatique que l'on recherche soit profi- 
table a la cellule h6te. On peut effectuer un criblage non 
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seulement par rapport h un fonction enzymatique mais 
Sgalement pour toute autre propriStS dSsirSe pour laquell 
on peut Stablir un essai biologique appropriS. On peut 
ainsi ef fectuer mSme dans le cas simple de la fonction 
£-gal visualisSe sur boite de PStri £ milieu X-gal, le 
criblage d'un "nombre de g§nes nouveaux de l'ordre de 100 
millions ou m§me d'un milliard pour une activitS cataly- 
tique ou une autre propriStS dSsirSe. 

Selection des cellules-hdtes modifiSes 

D' autre part, on peut utiliser des techniques de sSlection 
pour toute propriStS , cataly tique ou autre, dont la presen- 
ce ou 1' absence peut etre rendue essentielle h. la survie 
des cellules-hdtes contenant les vecteurs d 1 expression 
codant les g&nes nouveaux ou pouvant etre utiles pour la 
sSlection de virus codant et exprimant le gSne nouveau. A 
titre d'exemple concret, non limitatif , on va . maintenant 
revenir sur la description du mode de sSlection. en relation 
avec la fonction [b -galactosidase. Une souche appropriSe 
Z~EBG~ d ? E. Coli ne peut pas croitre en utilisant le 
lactose comme seule source de carbone. Ainsi f apr§s la mise 
en oeuvre de la premiSre Stape dScrite ci-dessus, on peut 
cultiver un tr&s grand nombre d'h6tes transformSs par des 
vecteurs d 1 expression codant les gSnes nouveaux, la culture 
Stant effectuSe dans des conditions sSlectives, soit en 
diminuant progressivement la concentration des autres 
sources de carbone, soit en utilisant seulement le lactose 
d£s le dSpart. Au cours d'une telle sSlection. la mutagS- 
n5se in vivo par voie de recombinaison ou par rScupSration 
explicite de vecteurs d 1 expression et mutagSnSse in vitro 
de leurs g&hes nouveaux par des mutagSnes variSs, ou par 
tout autre technique usuelle, permet des ameliorations 
adaptatives de l f aptitude k remplir la fonction catalytique 
dSsirSe. Lorsqu'il existe h la foi des techniques de 
sSlection et des techniques commodes d'essai biologique, 
comme dans le cas du prSsent exemple, on peut utiliser 
initialement des techniques de sSlection pour enrichir la 
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representation en bacteries hftt exprimant la foncti 0 „ 
B-gal, puis effectuer un criblage sur boite de Petri a 
Milieu 'x-gal afin identifier efficient des , « £■ 
positives. En 1'absence de technique d'essax biolog.que 
convenable, 1 ' application de conditions de 
plus en plus rigoureuses constitue la voxe la plus facxle 
pour - purifier un type ou un petit nombre de types de 
cellules-h6tes distinctes dont les vecteurs depression 
cedent les prolines catalysant la faction choisie. 

on peut utiliser ces techniques pour trouver de nouvelles 
prolines ayant une grande variete de caracterxstiques 
structurelles ou fonctionnelles en plus de 1'aptitude * 
catalyser des reactions specifics. Par exemple, on peut 
effectuer un criblage ou une selection pour trouver de 
nouvelles prolines se fixant sur des sites cis-regulateurs 
de l'ADN et bloquant de ce fait 1'expression d'une fonc- 
tion des cellules h&tes, ou encore bloquant la transcrxp- 
.tion de l'ADN, stimulant la transcription, etc. 

Par exemple, dans le cas de E. Coli une souche mutante du 
represseur de 1'operon lactose (i-> exprime de manxere 
constitutive la fonction (o-gal en raison du fait que 
1'operateur lactose n'est pas reprime. Toutes les cellules 
de ce genre produisent des clones bleus sur les boites de 
Petri contenant le milieu X-gal. II est possible de. trans- 
former de telles souches notes avec des vecteurs depres- 
sion synthetisant des proteines nouvelles et effectuer un 
criblage sur boite de P6tri • a milieu X-gal en vue de 
detecter les clones qui ne sont pas bleus. Parmi ceux-cx, 
certains representent des cas ou la nouvelle proteine se 
fixe sur 1'operateur lactose et reprime la synthase de 

ft -gal. On peut purifier en masse de tels plasmides, les 
retransformer , isoler les clones qui ne produisent pas la 

^-gal et effectuer ensuite une verification detaillee. 

Comme il est mentionne plus haut, le precede peut etre 
utilise aux fins de creer puis d' isoler non seulement des 
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prolines exploitables mais aussi des ARN et des ADN 
constituant des produits en soi, dot6s de propri6t§s 
exploitables. Ceci rSsulte evidemment du fait que d'une 
part, le proc6de consiste k cr^er des sequences stochasti- 
ques d • ADN , susceptibles d ■ interagir directement avec 
d'autres constituants cellulaires ou biochimiques, et que 
d 1 autre part ces sequences donees dans un vecteur d'expres- 
sioir sont transcrites en ARN eux aussi capables de multi- 
ples interactions biochimiques. 

Exemple de mise en oeuvre du procgde pour la creat ion et la 
selection d'un ADN exploitable en soi : 

Cet exemple illustre la selection d'un ADN exploitable et 
le purification et 1* etude du mecanisme d* action des 
proteines rggulatrices se liant & I'ADN. 

Soit une preparation du recepteur de l'oestradiol, une 
proteine obtenue par une methode connue en soi. En presence 
d' ©estradiol, une hormone stgrolde sexuelle, ce recepteur 
change de conformation et se lie fortement certaines 
sequences spScifiques de I'ADN ggnomique, affectant ainsi 
la transcription de gSnes impliques dans la dif ferenciation 
sexuelle et le contr&le de la fertilite. 

En incubant une melange constitue d'oestradiol, de son 
recepteur et d'un grand nombre de sequences stochastiques 
differant insgr€es dans leur vecteur puis en filtrant le 
melange & travers une membrane de nitro cellulose on 
obtient une selection directe des sequences stochastiques 
se liant au complexe oestrogSne - recepteur puisque seuls 
les ADN lies h une proteine sont retenus par la membrane. 
AprSs lavage et eiution, I'ADN libere de la membrane est 
utilise tel quel pour transformer des bacteries. Apres 
culture des bacteries transformees, on purifie h nouveau 
les vecteurs qu'elles contiennent et on proc&de h un ou 
plusieurs cycles d* incubation, filtration et transformation 
comme decrit ci-dessus. Ces operations permett nt d'isoler 
des sequences stochastiques d' ADN dot€es d'une af finite 
eievee pour le complexe oestradiol-recepteur. De telles 
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sequences sont susceptibles de nombreuses applications 
diagnostiques et pharmacologiques, en particuli r pour la 
mise au point d ' oestrogenes de synthese pour le contrOle de 
la fertility et le traitement de la st€rilit§. 

Crfiation et selection d'un ARN exp loitable en soi 

Soit un grand nombre de sequences d'ADN stochastique 
produites comme il a €t€ dicrit et donees dans un yecteur 
d'expression. II va de soi que l'ARN transcrit a partir de 
ces sequences dans des cellules-hfites transformees peut 
§tre un produit exploitable en soi. 

A titre d'exemple non limitatif, on peut seiectionner un 
gene stochastique codant pour un ARN de transfert (t-ARN) 
suppresseur par la procedure suivante : 

On transforroe par un grand nombre ( > 10 ) de sequences 
stochastiques , une souche bacterienne coropetente comportant 
une mutation , "nonsense" dans le gene arg E. On etale les 
bacteries transformees sur milieu minimal sans arginine et 
contenant 1 ■ antibiotique de selection du plasmide (ampicil- 
line s'il s'agit du vecteur pUC8) .Seules les bacteries 
transformees qui sont devenues capables de synthetiser 
1' arginine pourront croitre. Ce phenotype peut resulter 
soit d'une mutation en retour soit de 1 * introduction dans 
la cellule d'un suppresseur. II est facile de tester chaque 
colonie transformee pour determiner si le phenotype arg 
resulte ou non de la presence du gene stochastique dans son 
vecteur : on se contente de preparer le plasmide de cette 
colonie et de verifier qu'il confSre le phenotype Arg h 
toute cellule arg E qu'il transforme. 

selection de proteines capables de catalyser une se quence 
de reaction 

On va maintenant decrire un autre mode de selection, qui 
est susceptible d' applications ind6pendantes, fonde sur le 
principe de la selection simultanee, en parallSle, d'un 
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certain nombre de nouvelles proteines capables de catalyser 
une sequence de reactions connectges entre elles. 

L'idee mere de cette methode est la suivante : Ctant donne 
un ensemble de composes chimiques de depart considers 
comme des "briques" ou des elements de construction a 
partir desque'ls on desire effectuer la synthese d'un ou de 
plusieurs composes chimiques desires par 1 • intermediate 
d'une sequence de reactions chimiques catalys6es f il existe 
un tres grand nombre de voies de reaction pouvant se 
substituer les unes aux autres completement ou en partie, 
qui sent toutes possibles du point de vue thermodynamique 
et qui conduisent de V ensemble des "briques" ou blocs de 
construction au compose chimique cible desire. Une synthese 
efficace d'un compose cible est favorisee si chaque etape 
d'au moins l'un des trajets reactionnels menant de l'ensem- 
ble des "blocs de construction" au compose cible est 
constitue de reactions qui sont chacune catalyseea. Toute- 
fois, il est relativement moins important de determiner 
parmi les nombreux chemins r§actionnels completement ou 
partiellement independants ceux qui beneficient de la 
catalyse, Dans la description qui precede, on a montre 
comment il fitait possible d'obtenir un tres grand nombre de 
cellules hates qui expriment chacune une protfiine nouvelle 
distincte. 

Chacune de ces proteines nouvelles est susceptible de 
catalyser l'une quelconque des reactions possibles dans 
1- ensemble de toutes les reactions possibles conduisant de 
1' ensemble des blocs de construction au compose cible. Si 
un nombre de proteines stochastiques suffisamment grand est 
present dans un melange reactionnel contenant les composes 
constituant les blocs de construction, de sorte qu'un 
nombre suffisamment Sieve des reactions possibles se trouve 
catalysS, il y a une forte probabilite qu'une sequence de 
reactions connectSes entre elles pour conduire de 1' ensem- 
ble de blocs de construction au compose cible sera cataly- 
see par un sous-ensemble d s nouvelles proteines. Il est 
evident que le procede peut s'etendre a la catalyse non 
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seulement d'un, mais de plusieurs composgs cibles, simulta- 
ngment. 

En se fondant sur le principe qui vient d'etre gnoncg, on 
peut procSder de la maniSre suivante pour sglectionner en 
parallSle un ensemble de nouvelles protgines catalysant une 
sequence dgsirge de reactions chimiques : 

1. SpScifier 1* ensemble desirg de composgs constituant les 
"blocs de construction" en utilisant de prgfgrence un 
nombre raisonnablement glevg d'esp&ces chimiques distinctes 
afin d'augmenter le nombre de voies potentielles concur- 
rentes menant au composS chimique cible dgsirg. 

2. Dans un volume approprig d'une solution de milieu 
rgactionnel, ajouter un nombre trSs grand de nouvelles 
protgines stochastiques isolges k partir des cellules 
transformSes ou transfectges synthgtisant ces protgines. 
Effectuer un essai pour determiner si le coroposg cible est 
formS. Si c'est le cas, confirmer que cette formation 
nScessite la presence du melange des prolines nouvelles, 
Si c'est le cas, ce melange doit contenir un sous-ensemble 
de protgines catalysant une ou plusieurs sequences de 
reaction menant de 1' ensemble de "blocs de construction" au 
composi cible. Purifier en divisant la reserve initiale de 
clones qui synthStisent 1" ensemble de nouvelles protgines. * 
stochastiques, le sous-ensemble ngcessaire pour catalyser 
la sgquence de reactions conduisant au produit cible. 

Plus prgcisgment , k titre d'exemple non limitatif, on va 
dgcrire la sglection d'un ensemble de nouvelles protgines 
aptes k catalyser la synthSse d'un petit peptide spgcifig r 
Si savoir un pentapeptide , & partir d'un ensemble de blocs 
de construction constitug de peptides plus petits et 
d'acides amings. Tout peptide est constitug par une sgquen- 
ce lingaire de 20 types diffgrents d'acides amings, orien- 
tge de son extrgmitg amino k son extrgmitg carboxe. Tout 
peptide peut §tre formg en une gtape par condensation 
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terminale de deux peptides plus petits (ou de deux acides 
amings), ou par hydrolyse d'un peptide plus grand. Un 
peptide comprenant M residus pourra done etre formS d'un 
nombre egal a M -1 reactions de condensation. Le nombre de 
reactions, R, par lequel un ensemble de peptides ayant une 
longueur de 1. 2, 3... M residus, peut etre interconverti 
est plus grand que le nombre d'especes moleculaires T. Ceci 
s'exprime R/ T ~ M-2. Ainsi, en partant d'un ensemble donne" 
de peptides, un grand nombre de chemins reactionnels 
independants ou partiellement independants m&ne a la 
synthase d'un pentapeptide cible specif ique. On peut 
choisir un pentapeptide dont la presence peut etre commode- 
. ment deceive grace k un essai effectue par des techniques 
usuelles, par exemple par analyse HPLC (chromatographie en 
phase liquide sous haute pression) , chromatographie sur 
papier, etc. La formation de la liaison peptidique requiert 
de l'energie en milieu aqueux dilue mais, si les peptides 
participant aux reactions de condensation sont suf f isamment 
concentres, e'est la formation de .la liaison peptidique 
plut&t que 1* hydrolyse qui se trouve thermodynamiquement 
favorisee et qui se produit avec un rendement €lev§ en 
presence d'un catalyseur enzymatique approprig, par exemple 
la pepsine ou la trypsine, sans necessiter la pr€sence 
d'ATP ou d'autres composes a haute energie. On peut utili- 
ser un tel melange reactionnel de peptides de petite taille 
et dont les acides amines sont marques radioactivement , au 
moyen de traceurs radioactifs du type H, C, S, pour 
constituer 1' ensemble de blocs de construction a 
concentration suf fisamment Slevie pour conduire aux 
reactions de condensation. 

On peut, par exemple, procSder de la maniere suivante : 
on dissout environ 15mg de chaque acide amine" et petit 
peptide ayant 2 a 4 acides amines, choisis pour constituer 
1' ensemble de blocs de construction, dans un volume de 0,25 
ml a 1,0 ml de tampon phosphate a 0,1M, pH 7,6. On purifie 
un grand nombre de prolines nouvelles engendrees et 
isolees comme decrit ci-dessus a partir de leur hote 
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bactfirien ou autre. On dissout le melange de ces nouv 11 s 
prolines jusqu'& une concentration total finale de 
I'ordre de 0,8 k 1,0 mg/ml r dans le m§me tampon* On ajoute 
0,25 ml k 0,5 ml du melange de proteines au m§lange de 
blocs de construction. On incube k une temperature de 25°C 
i 40 °C pendant 1 k 40 heures. On enlSve des parties aliquo- 
tes de 8 ul Si intervalles r€guliers, dont le premier compte 
comme "tSmoin k blanc", avant l^djonction du mSlange de 
nouvelles prot6ines. On soumet les gchantillons k une 
analyse par chromatographie en utilisant comme solvant un 
mSlange de n-butanol-acide ac6tique-pyridine-eau 
(30:6:20:24 en volume). On seche le chromatograrame et on le 
r€v§le k la ninhydrine ou on 1 1 autoradiographic (avec ou 
sans 6cran d* intensification) . Du fait que les composes 
constituant les SlSments de construction sont marquSs 
radioactivement, le compos§ cible sera radioactif et il 
aura une activitS spScifique Slevie permettant sa detection 
au niveau de 1 k 10 ng. Au lieu de I 1 analyse par chromato- 
graphie habituelle, on peut effectuer une analyse par HPLC 
(high pressure liquid chromatography) qui est plus rapide 
et plus simple k effectuer. De maniSre gen§rale, on peut 
utiliser les procgdfis d f analyses usuels. De la sorte, on 
peut dStecter un rendement en composes cibles inf§rieur & 
une partie par million en poids par rapport aux compose s ou 
"matSriaux de construction" initiaux. 



Dans le cas oil le pentapeptide est f orm6 dans les condi- 
tions decrites ci-dessus mais oil sa formation n'a pas lieu 
lorsqu'on utilise un extrait purififi comme ci dessus mais 
obtenu k partir de cellules transferases par le vecteur 
d* expression dgpourvu d* insertion stochastique, la forma- 
tion du pentapeptide ne rgsulte pas de la presence des 
contaminants bactSriens et requiert done la pr§sence d'un 
sous-ensemble de nouvelles protSines dans le melange 
r£actionnel. 
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L'etape suivante consiste dans la separation du sous- 
ens mbl particulier de cellules qui conti nnent 1 s 
vecteurs d* expression des nouvelles prolines catalysant la 
sequence de reactions conduisant au pentapeptide cible. Par 
exemple si le nombre de reactions formant cette sequences 
est 6gal h 5, il y a environ 5 proteines nouvelles qui 
catalysent les reactions nScessaire. Dans le cas oil la 
"banque de clones" de bacteries contenant les vecteurs 
d' expression codant les g&nes nouveaux contient un nombre 
de g&nes nouveaux distincts de l'ordre de 1 000 000 , on 
effectue l 1 isolation en masse de tous ces vecteurs d 1 ex- 
pression et la retrans formation de 100 ensembles distincts 
de 10 8 bacteries avec un rapport de vecteurs h bacteries 
suffisamment faible pour que, en moyenne chaque ensemble de 
bacteries soit transforms par seulement environ la moitie 
du nombre de gfcne initiaux, c'est-i-dire environ 500 000. 
Par consequent, la probability pour qu'un quelconque de ces 
100 ensembles de bacteries contienne 1' ensemble des 5 
nouvelles proteines critiques est Sgal & (l/2) 5 =l/32. Parmi 
les 100 ensembles initiaux de bacteries, environ 3 contien- 
dront les 5 transformants critiques. Dans chacun de ces 
ensembles, la quantity totale de g&nes nouveaux pr€sente 
n'est plus que de 500 000 au lieu de un million. Par 
repetitions successives, dont le nombre total est dans le 
cas present de 20, de cette procedure on peut isoler les 5 
nouveaux g§nes critiques. AprSs quoi, la mutagenSse et la 
selection de cet ensemble de 5 gSnes stochastique permet la 
recherche de fonctions catalytiques ameiiorees. Dans le cas 
oil il est necessaire de catalyser une sequence de reactions 
comprenant un nombre de reactions de I'ordre de 20 et que 
20 gSnes codant des nouvelles proteines doivent Stre isoies 
en parall&le, il suffit d'ajuster la multiplicity des 
transformations de sorte que chaque ensemble de 10 bact6- 
ries recoivent 80% des 10 6 gSnes stochastiques en utilisant 
200 ensembles de ce genre. La probabilite que les 20 
nouv lies proteines se trouvent dans un ensemble donne de 
bacteries est de 0,8 20 c'est-i-dire environ 0,015. Par 
consequent, 2 parmi les 200 ensembles contiendront les 20 
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nouveaux genes necessair s pour catalyser la formation du 
compose cible. Le nombre de repetitions de cycl s n€ces- 
saires pour 1' isolation des 20 nouveaux g&nes est de 
l'ordre de 30. 

Les principes et les modes opgratoires enoncgs ci-dessus se 
ggngralisent du cas des peptides a de nombreux domaines de 
la chimie dans lesquels on peut effectuer des reactions en 
milieu agueux dans des conditions de pH, temperature et 
concentration des solutions permettant les fonctions 
enzymatiques ggngrales. Dans chaque cas, il est necessaire 
de pouvoir disposer d'une mSthode d'essai pour dgceler la 
formation du ou des composSs cibles dSsires. II faut aussi 
choisir un nombre suf fisamroent glevg de "blocs de cons- 
truction" pour augmenter le nombre de sSquences de reaction 
qui conduisent au compose" cible. 

L' ensemble concret qui vient d'etre donng de la synthase 
d'un pentapeptide cible peut etre generalise de la maniSre 
suivante : 

Le process tel qu'il est dScrit, engendre, entre autres 
produits, des peptides et prolines stochastiques. Ces 
peptides ou protSines peuvent agir, par voie catalytique ou 
autre, sur d' autres composis. lis peuvent igalement consti- 
tuer les substrats sur lesquels ils agissent. On peut ainsi 
sglectionner (ou cribler) la capacity qu'ont les peptides 
ou protSines stochastiques d'interagir entre eux et de ce 
fait de modifier la conformation, la structure ou la 
fonction de certains d' entre eux. De meme, on peut silec- 
tionner (ou cribler) la capacity de ces peptides et pro- 
lines a catalyser entre eux l'hydrolyse, la condensation, 
le transpeptidation ou d' autres reactions de modification. 
Par exemple, l'hydrolyse d'une proteine stochastique donnee 
par un membre au moins de 1' ensemble des peptides et 
prolines stochastiques peut etre suivie et mesurSe par 
marquage radioactif de la proteine donn€e suivi d'une 
incubation avec le melange des protgines stochastiqu s, en 
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presence d'ions tels que Mg, Ca, Zn, Fe et des composes ATP 
t GTP. On mesure ensuite 1' apparition des fragments 
radioactifs de la proline marquee, comme il a §t6 decrit. 
La ou les proteines stochastiques qui catalysent cette 
reaction peuvent alors etre isolees, ainsi que leur gene 
producteur, par diminution sequentielle de la librairie de 
clones transformants, comme dScrit. 

Une extension du procede" consiste en la selection d'un 
ensemble de peptides et polypeptides stochastiques capables 
de catalyser une suite de reactions menant des constituant 
de depart (acides amines et petits peptides) a certains des 
peptides ou polypeptides de 1' ensemble. II est ainsi 
envisageable de sSlectionner un ensemble capable de cataly- 
ser sa propre synthese : un tel ensemble r€f lexivement 
autocatalytique peut s'Stablir dans un chemostat ou les 
produits de reaction sont constamment diluSs mais ou la 
concentration, des produits de depart est maintenues cons- 
tante. On. peut verifier 1' existence d'un ensemble de cette 
nature par chromatographic sur gel a deux dimensions et par 
"HPLC" montrant la synthese d'une distribution stable de 
peptides et de polypeptides. Les volumes de reaction 
dependent du nombre d'especes moleculaires utilisees et des 
concentrations necessaires pour favoriser la formation de 
liaisons peptidiques par rapport k l'hydrolyse. La distri- 
bution des espSces molficulaires d'un ensemble autocataly- 
tique est susceptible de varier ou de deriver par suite de 
1' emergence d' ensembles autocatalytiques variants. Les 
peptides et polypeptides qui constituent un ensemble 
autocatalytique peuvent avoir certains Elements en commun 
avec le vaste ensemble de depart (constitug des peptides et 
polypeptides codSs selon le procSde) mais peuvent aussi 
contenir des peptides et polypeptides non codes par 1' en- 
semble des genes stochastiques codant 1' ensemble de depart. 



L' ensemble des genes stochastiques dont les produits sont 
necessaire pour 6tablir un tel ensemble autocatalytique 
peut etre isol€ comme il a 6t6 deer it, par diminutions 
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sSquentiell s de la libraire de clones trans formants. Par 
ailleurs, un ensemble autocatalytique p ut contenir des 
peptides cod6s initialement par les genes stochastiques et 
form§s de maniere continue dans 1' ensemble autocatalytique. 
Pour isoler ce sous-ensemble .code" de peptides et de pro- 
tiines on peut utiliser 1' ensemble autocatalytique pour 
obtenir, par immunisation chez 1* animal, des sSrums poly- 
clonaux reconnaissant un tres grand nombre des constituants 
de 1' ensemble autocatalytique. 

Ces serums peuvent ensuite §tre utilises pour cribler la 
librairie de genes stochastiques pour y trouver les gSnes 
exprimant des prot§ines capables de se combiner aux anti- 
corps presents dans ies s§rums. 

Cet ensemble de gSnes stochastiques exprime un grand nombre 
des protSines stochastiques cod€es qui persistent dans 
1' ensemble autocatalytique. Le reste des constituants codfis 
d'un tel ensemble autocatalytique peut Stre isole" par 
diminution sfiquentielle , comme d€crit, de la librairie de 
gSnes stochastiques dont le sous-ensemble dStectS par la 
methode immunologique a §t€ soustrait. 

Les ensembles autocatalytiques de peptides et de protgines 
obtenue de la maniere qui vient d'etre dgcrite sont suscep- 
tibles de trouver de nombreuses applications pratiques. 
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REVENDICATIONS 

1 . Proc6d6 de production de peptides ou polypeptides par 
voie raicrobiologique, caractfirisfi en ce que I'on produit 
simultan6ment, au sein d'un m§me milieu, des gSnes au moins 
partiellement composes de polynucleotides synthStiques 
stochastiques, que l'on introduit les gSnes ainsi obtenus 
dans des cellules-hates , que l'on cultive simultanfiment les 
souches indSpendantes de cellules-hotes modifies renfer- 
mant ces gSnes, de maniSre & doner les genes stochastiques 
et & provoquer la production des prot€ines exprimfies par 
chacun de ces gSnes stochastiques, que l'on effectue le 
criblage et/ou la selection des souches de cellules-hdtes 
modifies de facon k identifier les souches produisant des 
peptides ou polypeptides ayant au moins une propri6t€ 
donnSe, que l'on isole les souches ainsi identifies et 
qu'on les cultive de facon h produire au moins un peptide 
ou polypeptide ayant ladite propri6t€. 

2. Proc6dS selon la revendication 1, caract§ris§ par le 
fait qu'on produit les gSnes par copolym€risation stochas- 
tique des quatre sortes de deoxyphosphonuclSotides A, C, G 
et T i partir des deux extr€mit6s d'un vecteur d' expression 
prSalablement lingarisS, puis formation d'extr&nitSs 
coh§sives de facon & former un premier brin d'ADN stocha- 
stique, constitufi d'une molScule du vecteur d' expression 
poss€dant deux sequences stochastiques dont les extrSmitSs 
3' sont compl&nentair es , suivie de la synthase du second 
brin de cet ADN stochastique. 

3. ProcSd§ selon la revendication 1, caract§ris€ par le 
fait qu'on produit les gSnes par copolymSrisation stochas- 
tique d 1 oligonucleotides bicat€naire sans extr&nitSs 
cohgsives, de facon k former des fragments d'ADN stochas- 
tiques, suivie de la ligation de ces fragments h un vecteur 
d 1 expression pr€alablement lin€aris€. 

4. Proc§d6 selon la revendication 2 ou la r vendication 3, 
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caracterise" par le fait que le vecteur d' expression est un 
plasmide. 

5. Procgde" selon la revendication 4, caracteris€ par le 
fait que le vecteur d' expression est le plasmide pUC8. 

6. ProcSde" selon la revendication 2 ou la revendication 3, 
caracterise- par le fait que le vecteur d' expression est un 
fragment d'ADN viral. 

7. ProcSde" selon la revendication 2 ou la revendication 3, 
caracterise" par le fait que le vecteur d' expression est un 
hybride de plasmide et d'ADN viral. 

8. ProcSde" selon l'une des revendications 1 a 6, caractS- 
rise" par le fait que les cellules-hotes sont des cellules 
procaryotes. 

9. Procede" selon l'une des revendications 1 a 7, caractS- 
rise" par le fait que les cellules-hdtes sont des cellules 
eucaryotes . 

10. Process selon la revendication 8, caracterise" par le 
fait que les cellules sont choisies parmi HB 101 et C 600. 

11. Proc€dS selon la revendication 3, caracterise" par le 
fait que les oligonucleotides forment un groupe d'octameres 
palindromiques. 

12. Proc€d§ selon la revendication 11, caracterise" par le 
fait que le groupe d'octameres palindromiques est le groupe 
suivant : 

5' GGAATTCC 3' 
5' GGTCGACC 3' 
5' CAAGCTTG 3' 
5 ' CCATATGG 3 * 
5' CATCGATG 3' 
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13. Proc6d6 selon la revendication 3, caract6ris6 par le 
fait que les oligonucleotides forroent un groupe d'heptamS- 
res palindromiques. 

14. Proc6d§ selon la revendication 13 , caract6ris€ par le 
fait que le groupe d'heptamSres palindromiques est le 
groupe suivant : 

5« XTCGCGA 3' 
5' XCTGCAG 3 1 
5 1 RGGTACC 3' 
oil X = A, G, C ou T et R = A ou T. 

15. Procfidg selon la revendication 4 et l'une des revendi- 
cations 12 ou 14, caractSris6 par le fait que l'on isole et 
purifie I'ADN transformant des plasmides provenant d'une 
culture de souches ind€pendantes de cellules-h&tes modi- 
fies obtenues en proc§dant de la mani&re sp6cifi6e dans la 
revendication 11 ou la revendication 13, puis que l'on 
provoque la coupure de l'ADN purifi§ au moyen d'aU'inoins un 
enzyme de restriction correspondant & un site spScifique de 
coupure enzymatique present dans ces octamSres ou heptame- 
res palindromiques mais absent du vecteur d* expression 
utilis6, cette coupure Stant suivie de 1 ' inactivation de 
1' enzyme de restriction, et que l'on traite ensuite simul- 
tanSment 1* ensemble des fragments d'ADN stochastiques 
linearises ainsi obtenus par la T4 DNA ligase, de fagon & 
cr§er un nouvel ensemble d'ADN contenant des sequences 
stochastiques nouvelles, et que l'on utilise ce nouvel 
ensemble d'ADN transformant pour modifier des cellules- 
h6tes et doner les gSnes, et, finalement r que l'on crible 
et/ou sglectionne et isole les nouvelles souches de cel- 
lules-hfites transformges et qu'on les cultive de fagon k 
produire au moins un peptide ou polypeptide. 

16. Proc§d§ selon la revendication l r caractSrisS par le 
fait que ladite propriety est 1' aptitude h catalyser une 
reaction chimique donnfie. 
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17. Procede selon la revendication 1 pour la production 
d'une plurality de peptides et/ou polypeptides, caracterise" 
par le fait que ladite propriete est Inaptitude a catalyser 
une sequence de reactions conduisant d'un groupe initial 
donne de composes chimiques a au moins un compose cible. 

18. Procede selon la revendication 16 pour la production 
d'un ensemble constituS d'une plurality de peptides et/ou 
polypeptides ref lexivement autocatalytiques, caracterise 
par le fait que ladite propriete est 1« aptitude de cataly- 
ser la synthase de cet ensemble lui-meme a partir d'acides 
aminfis et/ou d' oligopeptides. 

19. Procede selon la revendication 1, caracterise par le 
fait que ladite propriete est 1' aptitude a modifier seiec- 
tivement les proprietes chimiques et/ou biologiques d'un 
compose donne. 

20. Procede selon la revendication 19, caracterise par le 
fait que ladite propriete est 1' aptitude a modifier seiec- 
tivement l'activite catalytique d'un polypeptide. 

21. Procede selon la revendication 19, caracterise par le 
fait que ladite propriete est 1' aptitude a simuler, ou 
modifier au moins une fonction biologique d'au mo ins un 
compose biologiquement actif . 

22. Procede selon la revendication 21, caracterise par le 
fait que ledit compose biologiquement actif est choisi 
parmi les hormones, les neurotransmetteurs , les facteurs 
d' adhesion ou de croissance et les regulateurs specif iques 
de la replication et/ou de la transcription de l'ADN et/ou 
de la traduction de l'ARN. 

23. Proc6de selon la revendication 1, caracterise par le 
fait que ladite propriete est 1» aptitude a se lier a un 
ligand donne. 
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24. Utilisation du peptide ou polypeptide obtenu par le 
precede selon la revendication 23 pour la det ction t/ou 
la titration d'un ligand. 

25. Proc€d6 selon la revendication 1, caracterise par le 
fait que ladite propri€t€ est d' avoir au moins un epitope 
semblable a l'un des epitopes d'un antigene donn§. 

26. Proced6 selon les revendications 19 et 25, caracterisg 
par le fait que ladite propriety est Inaptitude a simuler 
ou modifier les effets d'une molecule biologiquement active 
et que l'on effectue le criblage et/ou la selection de la 
souche de cellules-h6tes modi f iSe. prpduis ant au moins un 
peptide ou polypeptide ayant cette propriety en preparant 
des anticorps centre cette molecule, et en utilisant ces 
anticorps, apres leur purification, pour identifier les 
souches contenant ce peptide ou polypeptide, puis en 
cultivant les souches ainsi identifies et en separant et 
en purifiant le peptide ou polypeptide produit par ces 
souches, et, finalement, en soumettant ce peptide ou 
polypeptide a un essai in vitro pour verifier qu'il pre- 
sente bien 1' aptitude a simuler ou modifier les effets de 
ladite molecule. 

27. Polypeptides obtenus par le procfide selon la revendica- 
tion 1 ou la revendication 26, utilisables comme substance 
active ayant une action pharroacologique et/ou chimio- 
therapeutique . 

28. Peptides ou polypeptides, obtenus par le proc§d§ selon 
la revendication 25, utilisables pour diminuer, in-vitro 

ou in-vivo , la concentration en anticorps libres, spScifi- 
ques centre ledit antigene, par formation de liaisons entre 
c s peptides ou polypeptides et ces anticorps. 

29. Peptides ou polypeptides, selon la revendication 27 ou 
la revendication 28, utilisables comme agent suppr sseur 
d'hypersensibilit§ immunitaire. 
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30. Peptides ou polypeptides, obtenus par le procfid§ selon 
la revendication 25, utilisables comme agent de creation 
d'une tolerance k l'egard dudit antigSne. 

31. Proc6d£ selon la revendication 25, caractSrisS par le 
fait que 1" antigSne est I'EGF. 

32. Polypeptides obtenus par le procSde selon la revendi- 
cation 31, utilisables pour le traitement chimiothSrapeu- 
tique des 6pith§ Homes. 

33. ProcSdS selon la revendication 1, caractgrisfi par le 
fait que I'on identifie et isole les souches de cellules- 
hetes modifi§es produisant les peptides ou polypeptides 
ayant la preprints disir€e par chromatographie d'af finite 
sur anticorps correspondant k une proteine exprim§e par la 
partie naturelle de l'ADN hybride. 

34. Procede selon la revendication 33, caractSrisg par le 
fait que la partie naturelle de l'ADN hybride contient un 
gene exprimant la p>-galactosidase, et que I 1 on identifie et 
isole lesdites souches de cellules-h6tes modifi€es par 
chromatographie d'af finite sur anticorps anti-^-galactosi- 
dase. 

35. Procede selon la revendication 1 ou la revendication 
34, caractgrisg par le fait qu'aprSs expression et purifi- 
cation des peptides ou polypeptides hybrides, on sipare et 
isole leurs parties nouvelles. 

36. Application du procede selon la revendication 25 ou la 
revendication 26 pour la preparation d'un vaccin, caracti- 
risS par le fait que I'on isole des anticorps contre un 
agent pathogSne et on les utilise pour identifier les 
clones produisant au moins une proteine ayant au moins un 
gpitope semblable k l'un des epitopes d 1' agent pathogSne, 
on cultive les souches de cellules-h6tes modifiees corres- 
pondant k ces clones, de facon k produire cette proteine, 
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on isole et purifie cette protgine a partir des cultures de 
ces souches de cellules et on utilise cette protein pour 
la production d'un vaccin contre 1* agent pathogene. 

37. Application selon la revendication 36 pour la prepa- 
ration d'un vaccin anti-HVB r caracterise" par le fait que 
l'on extrait et l'on purifie au ntoins une proteine de 
capside de virus HVB, on injecte cette protSine dans 
l'organisme d'un animal capable de former des anticorps 
contre cette protgine, on recueille et on purifie les 
anticorps ainsi formgs, on utilise ces anticorps pour 
identifier les clones produisant au moins une proteine 
ayant au moins un epitope semblable h l'un des Epitopes du 
virus HVB, on cultive les souches de cellules-hdtes modi- 
figes correspondant a ces clones, de facon a produire cette 
protgine, on isole et purifie cette proline a partir des 
cultures de ces souches de cellules, et on utilise cette 
protgine pour la production d'un vaccin anti-HVB. 

38. Procgdg selon la revendication 1, caractgrisg par le 
fait que les cellules-h&tes consistent en bactgries du 
genre Escherichia coli dont le genome ne contient ni le 
gene naturel exprimant la /2>-galactosidase, ni le gene EBG, 
c'est-k-dire des bactgries E. coli (Z~, EBG~) , que l'on 
cultive les cellules-h6tes modifiges en presence du milieu 
X-gal et de l'inducteur IPTG, que l'on dStecte, dans le 
milieu de culture, les clones positifs pour la fonction 
ft-galactosidase et qu'on transplante ensuite cet ADN dans 
une souche de cellules-h6tes appropriie a la culture en 
grande quantitS en vue de la production industrielle d'au 
moins un peptide, polypeptide ou protgine. 

39. Procgdg selon la revendication 1, caractgrisg par le 
fait que ladite propriStS est 1' aptitude a se lier a un 
compose' donng. 

40. Procgdg selon la revendication 39, caractgrisg par le 
fait que 1 dit composS est choisi parmi les peptides, les 
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polypeptides et les protiines. 

41. Procgd§ selon la revendication 40 , caractgrisg par le 
fait que lesdites prolines sont des prolines rggulatrices 
de 1» activity de transcription ou de replication de l'ADN. 

42. Proc6d€ selon la revendication 39, caract£ris£ par le 
fait que ledit compose est choisi parmi les sequences d'ADN 
et d'ABN. 

43. Prolines obtenues par le procSde selon la revendica- 
tion 40 ou la revendication 42. 

44. ProcidS de production d'ADN , caract€ris6 par le fait 
que I'on produit simultanSment, au sein d'un m&ne milieu, 
des g&nes au moins partiellement composes de polynucleoti- 
des synthgtiques stochastiques, que I'on introduit les 
g&nes ainsi obtenus dans des cellules-hdtes, de facon & 
produire.un ensemble de cellules-hdtes modifies, que I'on 
cultive simultanSment les souches indSpendantes de cel- 
lules-hotes modifies ainsi produites, que l'on effectue un 
criblage et/ou une selection de cet ensemble, de facon k 
identifier les cellules-hotes qui renferment dans leur 
ggnomes des sequences stochastiques d'ADN pisentant au 
moins une propriStS d§sir£e et que l'on isole l'ADN £ 
partir de cultures de cellules-h6tes ainsi identifies. 

45. ProcSdS selon la revendication 44, caractgrisi par le 
fait que ladite propriety est l 1 aptitude £ se lier & un 
compose donnS. 

46. Procgdg selon la revendication 45, caractgrisfi par le 
fait que ledit compose est choisi parmi les peptides, les 
polypeptides et les protSines. 

47. Procgdg selon la revendication 45, caracterise par le 
fait que ledit compose est un compost rSgulateur de 1' acti- 
vity de transcription ou de replication de l'ADN. 
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48. Procgdg selon la revendication 47 , caractgrisg par 1 
fait que ledit composg est une protgine regulatrice de 
l'activitg de transcription ou de replication de l'ADN. 

49. Utilisation d'une sequence d'ADN obtenue par le precede 
selon la revendication 46 ou la revendication 47, comme 
sequence cis-regulatrice de la replication ou la transcrip- 
tion d'une sequence d'ADN voisine. 

50. ProcSdS selon la revendication 42, caract€ris6 par le 
fait que les prolines obtenues prgsentent en outre la 
propri€te de modifier 1' activity de transcription ou de 
replication ou la stabilitS de l'ADN. 

51. utilisation d'une proline obtenue par le procgdg selon 
la* revendication 48, pour modifier les proprigtgs de ■ 
transcription ou de replication ou de stabilitS d'une 
sgquence d'ADN, dans une cellule contenant cette sgquence 
d'ADN, et exprimant cette protgine. 

52. Procgdg de production d'ARN, caract€risg par le fait 
que l'on produit simultangment, au sein d'un mime milieu, 
des genes au moins partiellement composgs de polynuclgoti- 
des synthgtiques stochastiques, que l'on introduit les 
genes ainsi obtenus dans des cellules-hdtes, de facon a 
produire un ensemble de cellules-hdtes modifiges, que l'on 
cultive simultangment les souches indgpendantes de cellu- 
les-hotes modifiges ainsi produites, que l'on effectue un 
criblage et/ou une selection de cet ensemble, de facon a 
identifier les cellules-hdtes qui renferment des sgquences 
stochastiques d'ARN prgsentant au moins une proprigtg 
dgsirge et que l'on isole l'ARN a partir de cultures 
de cellule-hdtes ainsi identifiges. 

53. Procgd€ selon la revendication 52, caractgrisg par le 
fait qu ladite proprigtg est V aptitude a se lier a un 

compos 6 donnfi. 
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54. Procfide" selon la revendication 52, caract6ris§ par le 
fait que ladite propri€t§ est l'aptitud a catalyser une 
rfiaction chimique donn€e. 

55. ProcgdS selon la revendication 52, caract€ris6 par le 
fait que ladite propri^te" est d'etre un ABN de transfert. 
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ANNEXE AU RAPPORT DE RECHERCHE INTERNATIONALE RELATIF 



A LA DEMANDE INTERNATIONALE NO. PCT/CH 85/00099 (SA 9773) 



La presente annexe indique les membres de la famille de 
brevets relatifs aux documents brevets cites dans le rapport 
de recherche international vise ci-dessus. Lesdits membres 
sont ceux contenus au fichier informatique de l 1 Office 
europeen des brevets a la date du 03/12/85 

Les renseignements fournis sont donnes a titre indicatif 
et n'engagent pas la responsabilite de l 1 Off ice europeen 
des brevets.. 



Document brevet Date de Membre(s) de la Date de 

cite au rapport publication famille de brevets publication 

de recherche 



DE-A- 3246071 


14/06/84 


DE-A- 
DE-A- 


3300632 
3303173 


12/07/84 
02/08/84 


DE-A- 3303173 


02/08/84 


DE-A- 
DE-A- 


3246071 
3300632 


14/06/84 
12/07/84 


DE-A- 33006'32 


12/07/84 


DE-A- 
DE-A- 


3246071 
3303173 


14/06/84 
02/08/84 



Pour tout renseignement concernant cette annexe : 

voir Journal Officiel de 1' Office europeen des brevets, No. 12/82 



